<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<title>АОТ :: Технологии</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link href="aot.css" rel="stylesheet" type="text/css">
</head>

<body bgcolor="#F3F3F3" text="#000000" link="#000000" vlink="#999999" alink="#000000">
<a name="top"></a>
<table border="0" align="center" cellpadding="1" cellspacing="0">
  <tr>
    <td bgcolor="#666666"><table width="760" border="0" cellpadding="0" cellspacing="0" bgcolor="#FFFFFF">
        <tr>
          <td><table border="0" cellspacing="0" cellpadding="5">
              <tr>
                <td width="30">&nbsp;</td>
                <td><font size="+7" face="Arial, Helvetica, sans-serif"><b>AOT</b></font></td>
                <td width="40">&nbsp;</td>
                <td valign="baseline"><font size="+1" face="Arial, Helvetica, sans-serif"> Автоматическая  Обработка  Текста</font></td>
              </tr>
            </table>
            <table width="720" border="0" align="center" cellpadding="0" cellspacing="0" bgcolor="#000000">
              <tr>
                <td height="4"><img src="images/transparent.gif" width="1" height="4"></td>
              </tr>
              
            </table>
            <table width="760" border="0" cellpadding="0" cellspacing="0">
              <tr>
                <td width="180" valign="top"><table border="0" cellspacing="0" cellpadding="0">
                    <tr> 
                      <td width="20">&nbsp;</td>
                      <td width="150">&nbsp;</td>
                    </tr>
                    <tr> 
                      <td width="20">&nbsp;</td>
                      <td width="150">&nbsp;&nbsp;<a href="index.html" class="a">главная</a></td>
                    </tr>
                    <tr> 
                      <td width="20" height="1"><img src="images/transparent.gif" width="1" height="1"></td>
                      <td width="150" height="1" bgcolor="#000000"><img src="images/transparent.gif" width="1" height="1"></td>
                    </tr>
                    <tr> 
                      <td>&nbsp;</td>
                      <td>&nbsp;&nbsp;<a href="history.html" class="a">о нас</a></td>
                    </tr>
                    <tr> 
                      <td height="1"><img src="images/transparent.gif" width="1" height="1"></td>
                      <td height="1" bgcolor="#000000"><img src="images/transparent.gif" width="1" height="1"></td>
                    </tr>

                    <tr> 
                      <td width="20">&nbsp;</td>
                      <td width="150">&nbsp;&nbsp;<a href="onlinedemo.html" class="a">онлайн 
                        демо</a></td>
                    </tr>

                    <tr> 
                      <td width="20" height="1"><img src="images/transparent.gif" width="1" height="1"></td>
                      <td width="150" height="1" bgcolor="#000000"><img src="images/transparent.gif" width="1" height="1"></td>
                    </tr>
                    <tr> 
                      <td width="20">&nbsp;</td>
                      <td width="150">&nbsp;&nbsp;<a href="download.php" class="a">скачать</a></td>
                    </tr>
                    <tr> 
                      <td width="20" height="1"><img src="images/transparent.gif" width="1" height="1"></td>
                      <td width="150" height="1" bgcolor="#000000"><img src="images/transparent.gif" width="1" height="1"></td>
                    </tr>
                    <tr> 
                      <td width="20">&nbsp;</td>
                      <td width="150" bgcolor="#000000">&nbsp;&nbsp;<a href="technology.html" class="a"><font color="#FFFFFF">технологии</font></a></td>
                    </tr>
                    <tr> 
                      <td width="20" height="1"><img src="images/transparent.gif" width="1" height="1"></td>
                      <td width="150" height="1" bgcolor="#000000"><img src="images/transparent.gif" width="1" height="1"></td>
                    </tr>
                    <tr> 
                      <td width="20">&nbsp;</td>
                      <td width="150">&nbsp;&nbsp;<a href="mailto:sokirko@yandex.ru" class="a">контакт</a></td>
                    </tr>
                    <tr> 
                      <td width="20" height="1"><img src="images/transparent.gif" width="1" height="1"></td>
                      <td width="150" height="1" bgcolor="#000000"><img src="images/transparent.gif" width="1" height="1"></td>
                    </tr>
                  </table></td>
                <td valign="top"><table border="0" cellspacing="0" cellpadding="20">
                    <tr>
                      <td class="text">
                        <p>Наши технологии базируются на многоуровневом представлении естестевенного языка, которое, в свою очередь,  было заимствовано у системы ФРАП (Система французско-русского автоматического перевода была разработана коллективом лаборатории машинного перевода Всесоюзного центра переводов совместно с коллективом лаборатории машинного перевода МГПИИЯ им М. Тореза. 1976-1986 ГГ.)</p>
                        <p>Компоненты, составляющие языковую модель, - лингвистические процессоры, которые друг за другом обрабатывают входной текст. Вход одного процессора является выходом другого. Выделяются следующие компоненты:</p>
                        <ul>
                          <li>         Графематический анализ.  Выделение слов, цифровых комплексов, формул и т.д. (<a href="docs/graphan.html">подробнее</a>)</li>
                          <li>         Морфологический анализ. Построение морфологической интерпретации слов входного текста.(<a href="/docs/rusmorph.html">подробнее</a>)</li>
                          <li>         Синтаксический анализ. Построение дерева зависимостей всего предложения.(<a href="docs/synan.html">подробнее</a>)</li>
                          <li>         Семантический анализ. Построение семантического графа текста.(<a href="docs/seman.html">подробнее</a>)</li>
                        </ul>
                        <p>Для каждого уровня разрабатывался свой язык представления. Язык представления, как полагается, состоит из констант  и правила их комбинирования. На графематическом уровне константами были графематические дескрипторы (ЛЕ – лексема, ЦК – цифровой комплекс и т.д.) На морфологическом уровне – граммемы (рд – родительный падеж, мн  -множественное число).  На синтаксическом – названия отношений и групп (ПОДЛ – отношение между подлежащим и сказуемым, ПГ  - предложная группа).  На семантическом – семантические категории и отношения.</p>
                        <p>С каждого уровня представления можно сделать переход к такому же представлению на другом естественном языке (трансфер),  что позволяет осуществлять перевод, даже если &quot;глубокий&quot; (семантический) анализатор не смог обработать текст. Основой для построения уровней служили результаты работы предыдущих этапов, но, что важно, последующие анализаторы также могли улучшить представление предыдущих. Например,  для какого-то предложения синтаксический анализатор не смог построить полного дерева зависимостей, тогда, возможно, семантический анализатор сможет спроектировать им построенный семантический граф на синтаксис.</p>
                        <p>Таким образом, текст обрабатывается по следующей технологии:</p>
                        <table border="0" align="center" cellpadding="5" cellspacing="0">
                          <tr>
                            <td>
							<img src="images/tech-sch.gif" alt="Блок-схема технологии обработки текста" width=510 height=450 border=0 usemap="#tech_sch_map">
							<map name="tech_sch_map">
							    <area shape="rect" alt="АОСС" coords="331,391,389,419" href="docs/aoss.html">
							    <area shape="rect" alt="РОСС" coords="391,331,449,359" href="docs/ross.html">
							    <area shape="rect" alt="ТаймРосс" coords="391,301,479,329" href="docs/timeross.html">
							    <area shape="rect" alt="Словосочетания" coords="391,271,508,299" href="docs/collocs.html">
							    <area shape="rect" alt="Тезаурусы" coords="331,211,419,239" href="docs/thes.html">
							    <area shape="rect" alt="Русский морфологический словарь" coords="331,91,479,119" href="docs/rusmorph.html">
							    <area shape="rect" alt="Бинарный словарь" coords="1,363,119,391" href="#">
							    <area shape="rect" alt="Словари оборотов" coords="1,91,119,119" href="docs/oborots.html">
							    <area shape="rect" alt="Синтез" coords="181,421,299,448" href="#">
							    <area shape="rect" alt="Трансфер" coords="181,361,299,389" href="docs/transfer.html">
							    <area shape="rect" alt="Первичносемантический анализ" coords="121,301,359,329" href="docs/seman.html">
							    <area shape="rect" alt="Синтаксис" coords="179,241,297,269" href="docs/synan.html">
							    <area shape="rect" alt="Фрагментация" coords="181,181,299,209" href="docs/fragman.html">
							    <area shape="rect" alt="Постморфология" coords="181,121,299,149" href="docs/mapost.html">
							    <area shape="rect" alt="Морфология" coords="181,61,299,89" href="docs/morph.html">
							    <area shape="rect" alt="Графематика" coords="181,1,299,29" href="docs/graphan.html">
							</map>
							</td>
                          </tr>
                          <tr>
                            <td class="textsmall">(Для получения дополнительной информации, кликните на интересующем блоке схемы.)</td>
                          </tr>
                        </table>
                        <p>С некоторыми особенностями проекта можно ознакомиться  в следующих работах:</p>
                        <p>1. Диссертация А.Сокирко &quot;Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ)&quot;:<br>
							<table>
                        	<tr> <td width="10%"></td><td> <a href="docs/sokirko/sokirko-candid-1.html">Введение</a></td></tr>
	                        <tr> <td></td><td><a href="docs/sokirko/sokirko-candid-2.html">Глава 1. Обзор литературы</a></td></tr>
                        	<tr> <td></td><td><a href="docs/sokirko/sokirko-candid-3.html">Глава 2. Досемантический анализ русского текста</a></td></tr>
                        	<tr> <td></td><td><a href="docs/sokirko/sokirko-candid-4.html">Глава 3. Первичный семантический анализ русского текста</a></td></tr>
                        	<tr> <td></td><td><a href="docs/sokirko/sokirko-candid-5.html">Глава 4. Синтез английского текста</a></td></tr>
                        	<tr> <td></td><td><a href="docs/sokirko/sokirko-candid-6.html">Заключение</a></td></tr>
                        	<tr> <td></td><td><a href="docs/sokirko/sokirko-candid-7.html">Литература</a></td></tr>
                        	<tr> <td></td><td><a href="docs/sokirko/sokirko-candid-8.html">Выступление на защите</a></p>
							</table>
                        <p>2. Alexey Sokirko. 2001 <a href="docs/sokirko/sokirko-candid-eng.html">A short description of Dialing Project</a><b><font size="-1" face="Arial, Helvetica, sans-serif">.</font></b></p>
                        <p>3. Алексей Сокирко. 2003. <a href="docs/Dialog_text.htm">DDC - программа поиска по морфологически и cинтаксически размеченному массиву</a><b><font size="-1" face="Arial, Helvetica, sans-serif">.</font></b></p>
                        <p>4. Alexey Sokirko. 2003 <a href="docs/OverviewOfConcordance.htm ">A technical overview of DWDS/Dialing Concordance </a>				<b><font size="-1" face="Arial, Helvetica, sans-serif">.</font></b></p>
                        <p>5. Алексей Сокирко. 2004 <a href="docs/sokirko/Dialog2004.htm"> Морфологические модули на сайте www.aot.ru </a>				<b><font size="-1" face="Arial, Helvetica, sans-serif">.</font></b></p>
                        <p>6. Диссертация Игоря Ножова(<a href="mailto:nozhov@yandex.ru">nozhov@yandex.ru)</a> &quot;Морфологическая и синтаксическая обработка текста(модели и программы)&quot;, 2003 год :<br>
							<table>
	                       	<tr> <td width="20%"></td><td> <a href="docs/Nozhov/chapter1.pdf ">Глава 1</a> </td></tr>
							<tr> <td></td><td><a href="docs/Nozhov/chapter2.pdf">Глава 2</a> </td></tr>
							<tr> <td></td><td><a href="docs/Nozhov/chapter3.pdf">Глава 3</a> </td></tr>
							<tr> <td></td><td><a href="docs/Nozhov/chapter4.pdf">Глава 4</a> </td></tr>
							<tr> <td></td><td><a href="docs/Nozhov/supplement1.pdf">Приложение 1</a> </td></tr>
							<tr> <td></td><td><a href="docs/Nozhov/supplement2.pdf">Приложение 2</a> </td></tr>
							<tr> <td></td><td><a href="docs/Nozhov/msot.pdf ">Вся диссертация одним файлом (4 Mb)</a> </td></tr>
							</table>
						</p>	
						<p>7. Алексей Сокирко и Светлана Толдова. 2005 <a href="docs/RusCorporaHMM.htm">  Сравнение  эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический  анализатор именных групп)</a> </p>

                        <p align="center"><font size="-1" face="Arial, Helvetica, sans-serif"><a href="history.html">о&nbsp;нас</a> <a href="product.html">продукты</a> <a href="download.php">скачать</a> <a href="1"><b>технологии</b></a> <a href="onlinedemo.html">демо</a> <a href="1">поиск</a>&nbsp; <a href="#top" title="наверх">^</a></font></p></tr>
                  </table></td>
              </tr>
              
              <tr>
                <td valign="bottom">&nbsp;</td>
                <td align="right" valign="bottom"><table border="0" cellspacing="5" cellpadding="0">
                    <tr> 
                      <td align="right"><font color="#999999" size="1">Разработка 
                        <a href="mailto:simple@mosk.ru"><font color="#999999">DiP</font></a>.<br>
                        &copy; 2003 <a href="http://www.aot.ru/"><font color="#999999">АОТ</font></a>. 
                        Все права защищены.</font></td>
                      <td width="5">&nbsp;</td>
                    </tr>
                  </table></td>
              </tr>
            </table></td>
        </tr>
      </table></td>
    <td bgcolor="#CCCCCC"><img src="images/transparent.gif" width="1" height="1"></td>
  </tr>
  <tr>
    <td bgcolor="#CCCCCC"><img src="images/transparent.gif" width="1" height="1"></td>
    <td bgcolor="#CCCCCC"><img src="images/transparent.gif" width="1" height="1"></td>
  </tr>
</table>
</body>
</html>
